![]() Systeme de traduction automatique
专利摘要:
公开号:WO1990007159A1 申请号:PCT/JP1989/001264 申请日:1989-12-15 公开日:1990-06-28 发明作者:Akira Takagi;Jun Takada;Minoru Yukawa 申请人:Kabushiki Kaisha Csk; IPC主号:G06F40-00
专利说明:
[0001] 明 [0002] 機械翻訳 シ ス テ ム [0003] [技術分野 ] [0004] 本発明 は 、 日 本語を所定の翻訳言語に 自 動的 に翻訳す る機械翻訳 シ ス テ ム に 関す る 。 [0005] [背景技術 ] [0006] 糸田 [0007] 近年 、 コ ン ピ ュ ー タ や通信技術の発展に伴い 、 あ ら ゆ る 分野 に お い て国際間の情報交換が極めて活発 に な っ て き て い る 。 様 々 な経済活動が地球規模で行われる よ う に な っ て き た今 日 、 国際 コ ミ ニ ュ ケ一 シ ヨ ン の重要性は益 々 高 ま っ て き て い る 。 [0008] こ の よ う な状況の下、 コ ン ピ ュ ー タ を 用 いて 日 英間の 翻訳を 自 動的 に行 う シ ス テ ム の開発が望 ま れ、 こ れ ま で 種 々 の機械翻訳 シス テ ムが開発さ れて き て い る 。 [0009] 従来の 日 本語を英語に翻訳す る機械翻訳 シス テ ム と し て は 、 文脈 自 由文法や依存文法等に基づ いて原文の組立 て を解析 す る 意味 ト ラ ン ス フ ァ 方式 が主流 と な っ て い る 。 [0010] 従来の機械翻訳 シ ス テ ム に お いて は 、 上述の如 く 文脈 自 由文法や格関係に基づ く 構文解析に よ っ て原文の組立 て を解析す る が、 こ の方式で は文体毎に構文解析規則 を 必要 と し かつ 同 じ意味の文で も語順が異なればそれぞれ 一 一 に異な る規則 が必要であ る ため、 構文解析規則の数が無 数 と な る 。 [0011] し か し 、 現実に はあ ら ゆる文体に応 じ て無数の構文解 析規則 を 用意す る の は不可能で あ る こ と か ら 、 実際に翻 訳処理を行 う と き は、 前編集処理を行っ て原文を変形 し た上で構文解析処理等を行っ て い る 。 こ の よ う に従来の 方式で は 、 翻訳の際に前編集処理等の手間が必要 と な る ため処理効率が悪い と い つ た欠点があ っ た。 [0012] [発明の 開示 ] [0013] 本発明 は 、 上記の よ う な従来の課題を解決す る ため に なさ れた も の で、 こ れま での よ う に前編集処理を行 う 必 要がな く 、 あ ら ゆ る文体の 日 本文を効率 よ く 翻訳処理で き る よ う に な る機械翻訳システム を提供す る こ と を 目 的 と する 。 [0014] こ の 目 的 を達成す る本発明の機械翻訳システ ムは、 入 力 さ れた原文を単語に分割 し 、 該単語に単語の持つ文法 情報及び意味情報を付加す る形態素解析処理と 、 上記形 態素解析処理に よ り 分割さ れた単語相互の係 り 受け構造 を上記文法情報 と 意味情報及び解析親則 に従 っ て解析 し 、 上記原文の解析木を生成す る構文解析処理 と 、 構文 解析に よ る解析木を翻訳言語が生成可能な解析木に変換 す る構文変換処理 と 、 翻訳言語への生成規則に基づき翻 訳文を生成す る生成処理と 、 生成さ れた翻訳文の各単語 を付加情報に基づ き語形変化さ せ る形態素合成処理 と か ら な る 機械翻訳 シ ス テ ム に お い て 、 上記構文解析処理 は 、 係 ら れ る語 と 係る語の品詞 の組み合わせ に応 じ て解 析規則 を記述 し た品詞マ 卜 リ ッ ク ス テー ブルか ら単語相 互の組み合わせに対応す る規則 を取 り 出 し係 り 受け (修 飾 , 被修飾関係) の有無を判別す る処理 と 、 係 り 受け が 成立 し た単語を部分解析木 と し て順次ス タ ッ ク す る処理 と 、 ス タ ッ ク さ れた部分解析木か ら上記原文に対応す る 解析木 を 出力す る処理か ら な る こ と を特徴 と す る 。 [0015] 上記本発明 に よ れば、 構文解析を行 う ための規則 が最 大品詞 の 2 乗の数で済むた め 、 こ れ ま で の よ う に 前編集 処理 を行 う 必要がな く な り 、 あ ら ゆ る文体の 日 本文 を効 率 よ く 翻訳処理で き る よ う に な る 。 [0016] [ 図面の簡単な説明 ] [0017] 第 1 図 は本発明 に よ る機械翻訳 シ ス テ ム の機能プ ロ ッ ク 図 、 [0018] 第 2 図 は本発明 に よ る機械翻訳 シ ス テ ム の翻訳処理の 流れを示す フ ロ ーチ ヤ 一 卜 、 [0019] 第 3 図 は 日 本語辞書部の 内容を示す 図、 [0020] 第 4 図 は品詞マ 卜 リ ッ ク ス テ ーブルの 内容を示す図 、 第 5 図 ( a ) 〜 ( c ) は部分解析木を ス タ ッ ク に格納 し た 状態 を示す 図 、 [0021] 第 6 図 ( a ) は構文解析処理に よ っ て 出力さ れ る解析 木 を示す 図 、 [0022] 第 6 図 ( b ) は構文変換処理に よ り 生成さ れる解析木 を示す図 で あ る 。 [0023] [発明 を実施.す る ため の最良の形態 ] [0024] 以下、 本発明の実施例 につ いて図面を参照 し て詳細に 説明す る 。 [0025] 第 1 図 は本発明 に よ る機械翻訳シス テ ム の機能ブ 口 ッ ク 図で あ る 。 [0026] 本機械翻訳シ ス テ ム は、 翻訳処理部 1 と 、 翻訳処理用 の 内部デー タ 部 2 と 、 翻訳処理用 の外部データ 部 3 と で 構成さ れて い る 。 ま た、 内部デー タ部 2 は品詞マ 卜 リ ツ ク ス テーブル 2 1 と 品詞間違接テーブル 2 2 を有 し 、 外 部デー タ部 3 は 日本語辞書部 3 1 と交換辞書部 3 2 と生 成規則部 3 3 を有 し て な る 。 [0027] 上記翻訳処理部 1 は、 形態素解析部 1 1 と 、 構文解析 部 1 2 と 、 構文変換部 1 3 と 、 文生成部 1 4 と 、 形態素 合成部 1 5 か ら な る 。 [0028] 上記形態素解析部 1 1 は、 第 2 図の フ ロ ーチ ャ ー ト に 示す よ う に入力 さ れた 日本文を単語に分割 し 、 該単語に 単語の持つ文法情報及び意味情報を付加す る形態素解析 処理 S 1 を行な う 。 構文解析部 1 2 は、 上記形態素解析 処理 S 1 に よ り 分割 さ れた単語相互の係 り 受け (修飾, 被修飾関係) 構造を上記文法情報 と意味情報及び解析親 則 に従っ て解析 し 、 上記 日 本文の解析木を生成す る構文 解析処理 S 3 を行な う 。 構文変換部 1 3 は、 構文解析結 果 か ら 日 本文 を英文 の 構造 に 変換 す る 構文変 換処理 S 5 を行 な う 。 文生成部 1 4 は 、 英文への生成規則 に基 づ き 英文 を生成す る文生成処理 S 7 を行 な い、 形態素合 成部 1 5 は 、 生成 さ れた英文の各単語を付加情報 に基づ き 語形変化 さ せ る 形態素合成処理部 S 9 を行な う 。 こ れ に よ っ て 日 本文か ら英文への翻訳を行 う 。 [0029] 次に具体的 な翻訳処理例 を挙げて各処理内容を詳 し く 解説す る 。 [0030] "私は 、 新宿で本 を 買 っ た。 " と い う 日 本文 を英文に 翻訳す る場合 、 ま ず形態素解析部 1 1 の形態素解析処理 S 1 に お い て上記原文を次に よ う に単語 に 分割す る 。 [0031] 私ノはノ新宿ノでノ本ノをノ買 つ た。 / [0032] そ の際 、 例 え ば "私は " を 1 つの単語 と し て 区切 っ た 場合 、 "私 は " と い う 語の 活用 の有無 を 内 部 デー タ 部 2 の品詞間連接テーブル 2 2 と 外部デー タ 部 3 の第 3 図 に示す構成の 日 本語辞書部 3 1 を参照す る こ と に よ っ て 判別す る 。 こ の場合 "私は " は無活用 で あ る か ら 、 .さ ら に形態素解析処理 が行 わ れ "私 " と " は " に 分割 さ れ る 。 [0033] こ こ で 、 本 シ ス テ ム の品詞間連接テ ー ブル 2 2 に は 、 形態素間 の連接が可能か ど う かの連接情報が格納 さ れて い る 。 ま た 、 日 本語辞書部 3 1 に は、 図示の如 く 各単語 の品詞 、 意味素性、 格等の文法情報及び意味情報が登録 さ れて い る 。 分割 さ れた各単語に は 、 上記 日 本語辞書部 3 1 か ら そ の単語の文法情報及び意味情報が付加さ れ、 次の構文解析部 1 2 の構文解析処理 S 3 に移さ れる 。 構文解析部 1 2 の構文解析処理 S 3 で は 、 ま ず第 1 に 上記分割 し て得た単語を 2 語づっ取 り 出 し て係 り 受けの 判別 を行 う 。 こ の係 り 受けの判別 は、 係 ら れる語 と係る 語の品詞の組み合わせに応 じ て解析規則 を記述 し た内部 デー タ部 2 の品詞マ 卜 リ ッ ク ステーブル 2 1 に基づいて 行 う 。 即 ち 、 取 り 出 し た 2 つ単語相互の組み合わせに対 応す る規則 を品詞マ ト リ ッ ク ステーブル 2 1 か ら取 り 出 し係 り 受け が成立す る か ど う かを判別す る 。 上記品詞マ 卜 リ ッ ク ステ一ブル 2 1 には、 最大品詞の数の 2 乗に相 当 す る 数の 規則 が規定さ れて い る 。 な お 、 2 つ の単語 は、 文頭か ら順に選択する も の と す る 。 こ れは、 日 本語 にお いて は、 原則 と し て文の後方にあ る語が前方にあ る 語に係る こ と はな い こ と に よ る 。 [0034] 上記具体例 の場合 、 ま ず文頭か ら 順 に "私 " (代名 詞 ) と " は " (格助詞) を取 り 出 し 、 第 4 図に示す よ う な構成の品詞マ ト リ ッ ク ス テーブル 2 1 を読む。 こ こ で は 、 代名詞 の "私 " が係る語で格助詞の " は " が係 られ る語で あ る か ら 、 品詞マ ト リ ッ ク ステーブル 2 1 の対応 す る組み合わせ位置か ら規則 A を読出す。 こ こ で 、 規則 A に は 、 例 えば "代名詞が格助詞 に係る " と 規定さ れて お り 、 こ れ に よ り 係 り 受 け が成立す る こ と が判断さ れ る 。 次に、 " は " と "新宿 " (名詞) を取 り 出 し 、 品詞 マ ト リ ッ ク ス テーブル 2 1 を読む と規則 C を得る 。 こ こ で 、 規貝 lj C に は、 "係 り 受け力5成立 し な い " と 規定 さ れ て お り 、 上記 2 語の取 り 出 し は無視さ れる 。 [0035] 構文解析処理 S 3 で は 、 第 2 に 係 り 受 け が成立 し た 2 つ の単語 を部分解析木 と し て順次ス タ ッ ク 5 に格納 し て い く 。 例 え ば、 上記 "私 " と " は " で は 、 係 り 受 け が 成立 し た の で 、 第 5 図 (a) の よ う に部分解析木を生成 し て ス タ ッ ク 5 に入れる 。 こ の ス タ ッ ク 5.に は 、 後入れ先 出 し 型の ス タ ッ ク が用 い ら れて い る 。 ま た 、 "新宿 " と " で " ( 格助詞 ) の組み合 わ せ及 び " 本 " ( 名 詞 ) と " を " (格助詞) の組み合わせで係 り 受け が成立す る の で 、 第 5 図 (b) 及び第 5 図 (c) に示す よ う にそ れぞれの 2 語で部分解析木を生成 し順次ス タ ッ ク 5 に入れる 。 [0036] " を " (格助詞) と "買 う " (動詞 ) の 2 語を取 り 出 し 品詞 マ ト リ ッ ク ス テーブル 2 1 を読む と 、 対応す る規 則 B に は 、 例 え ば "動詞の格ス ロ ッ 卜 に あ る連結語及び 意味素 と 、 係 ろ う と し て い る格助詞及びそ の下の名詞 の 意味素が一致す る な ら係る " と 規定さ れて い る 。 本例で は 、 日 本語辞書部 3 1 の "買 う " の格ス ロ ッ ト に あ る連 結語が " を " で、 意味素が 商品 であ り 、 かつ係 ろ う と し て い る 格助詞が " を " でかつそ の下の名詞 "本 " の 意味素が "商品 " で あ る か ら 、 上記規則 を満足す る 。 こ の結果、 " を " と "買 う " で係 り 受けが成立す る こ と が 判別 さ れ、 そ の部分解析木がス タ ッ ク 5 に格納 さ れる 。 [0037] 最後 に 、 構文解析処理 S 3 で は 、 ス タ ッ ク 5 に格納 さ れ た 部 分 解析木 か ら 原 文 の 日 本文 に 対応 す る 第 6 図 ( a ) に示す よ う な解析木を生成 し て 出力す る 。 [0038] 構文変換部 1 3 の構文変換処理 S 5 で は、 構文解析部 1 2 か ら 出力 さ れた解析木を翻訳言語であ る英語の解析 木に変換す る 。 その際、 日 本語に対応す る英語への置き 換え を行う 。 英語へ 置 き 換え は、 外部データ部 3 の変 換辞書部 3 2 を参照 してなさ れる 。 構文変換処理 S 5 に よ り 変換さ れた解析木を第 6 図 ( b ) に示す。 [0039] 文生成部 1 4 の文生成処理 S 7 では、 上記英語が生成 可能な解析木を 1 次元列に並べ換えて英文 ( I buy a bo ok in Sin jyuku )を生成す る 。 そ の 際 、 外部デー タ 部 3 の生成規則部 3 3 を参照する 。 [0040] ま た、 形態素合成部 1 5 の形態素合成処理 S 9 で は、 生成さ れた英文の各単語を活用情報 (動詞の過去形、 名 詞 の複数形等) に基づ き語形変化させて最終的 な翻訳結 果 ( I bought a book in S in jyuku ) を出.力す る 。 [0041] なお 、 上記実施例で は 日 本文を英文に翻訳す る場合を 説明 し たが、 翻訳言語につ いて は英語に限 ら ず フ ラ ン ス 語や ロ シ ア語な どの言語への翻訳に も本発明 を適用 す る こ と がで き る 。
权利要求:
Claims 請 求 の 範 囲 ( 1 ) 入力 さ れた原文を単語に分割 し 、 該単語 に単語の 持つ文法情報及 び意味情報 を付加 す る 形態素解析処理 と 、 上記形態素解析処理に よ り 分割 さ れた単語相互の 係 り 受け構造を上記文法情報 と 意味.情報及び解析規則 に 従 っ て解析 し 、 上記原文の解析木を生成す る構文解析処 理 と 、 構文解析に よ る解析木を翻訳言語が生成可能な解析木 に変換す る 構文変換処理 と 、 翻訳言語への生成規則 に基づ き 翻訳文を生成す る生成 処理 と 、 生成さ れた翻訳文の各単語を付加情報 に基づ き 語形変 化さ せ る形態素合成処理 と か ら な る機械翻訳 シス テ ム に お いて 、 上記構文解析処理は 、 係 ら れる語 と 係 る語の品詞の組 み合わせ に応 じ て解析規則 を記述 し た品詞マ ト リ ッ ク ス テ ーブルか ら単語相互の組み合わせに対応す る親則 を取 り 出 し係 り 受け (修飾 . 被修飾関係) の有無を判別す る 処理 と 、 係 り 受けが成立 し た単語を部分解析木 と し て順 次ス タ ッ ク す る処理 と 、 ス タ ッ ク さ れた部分解析木か ら 上記原文に対応す る解析木を 出力す る処理か ら な る こ と を特徴 と す る機械翻訳 シ ステ ム 。 ( 2 ) 請求の範囲第 1 項記載の機械翻訳 シス テ ム で あ つ て、 単語間 の連接が可能か ど う かの連接情報を格納す る品 詞間連接テーブル と 、 単語に付加す る文法情報及び意味 情報を格納す る辞書を備え 、 形態素解析処理にお いて、 上記品詞間連接テーブル と辞書を参照 し形態素の活用 の 有無を判別す る こ と を特徴 と す る もの。 ( 3 ) 請求 の範囲第 1 項に記載の機械翻訳 シ ス テ ム で あ っ て 、 構文解析処理では形態素解析処理に よ っ て分割さ れた 単語を文頭か ら順に 2 語づっ取 り 出 し て係 り 受けの判別 を行な う こ と を特徵 と す る も の。
类似技术:
公开号 | 公开日 | 专利标题 Maekawa et al.2014|Balanced corpus of contemporary written Japanese Ge et al.2005|A statistical semantic parser that integrates syntax and semantics US8543374B2|2013-09-24|Translation system combining hierarchical and phrase-based models US9798720B2|2017-10-24|Hybrid machine translation Tapanainen et al.1997|A non-projective dependency parser US6356865B1|2002-03-12|Method and apparatus for performing spoken language translation JP4404211B2|2010-01-27|マルチリンガル翻訳メモリ、翻訳方法および翻訳プログラム US7239998B2|2007-07-03|Performing machine translation using a unified language model and translation model US6965857B1|2005-11-15|Method and apparatus for deriving information from written text US6721697B1|2004-04-13|Method and system for reducing lexical ambiguity JP4986919B2|2012-07-25|タグ付きデータを有する完全形式レキシコンおよびタグ付きデータを構成し使用する方法 US5594641A|1997-01-14|Finite-state transduction of related word forms for text indexing and retrieval US6442524B1|2002-08-27|Analyzing inflectional morphology in a spoken language translation system EP1131743B1|2005-01-12|Universal translation method US7526424B2|2009-04-28|Sentence realization model for a natural language generation system US5848385A|1998-12-08|Machine translation system using well formed substructures US5548508A|1996-08-20|Machine translation apparatus for translating document with tag US6463404B1|2002-10-08|Translation KR100238189B1|2000-01-15|다중 언어 tts장치 및 다중 언어 tts 처리 방법 US6092034A|2000-07-18|Statistical translation system and method for fast sense disambiguation and translation of large corpora using fertility models and sense models US5418717A|1995-05-23|Multiple score language processing system US7970600B2|2011-06-28|Using a first natural language parser to train a second parser US6243669B1|2001-06-05|Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation US4635199A|1987-01-06|Pivot-type machine translating system comprising a pragmatic table for checking semantic structures, a pivot representation, and a result of translation US5895446A|1999-04-20|Pattern-based translation method and system
同族专利:
公开号 | 公开日 EP0403660A1|1990-12-27| JPH02165378A|1990-06-26| US5136503A|1992-08-04| EP0403660A4|1992-09-30| CA2006039A1|1990-06-20|
引用文献:
公开号 | 申请日 | 公开日 | 申请人 | 专利标题 JPS63175971A|1987-01-16|1988-07-20|Nippon Telegr & Teleph Corp <Ntt>|Natural language processing system|US6283952B1|1992-12-30|2001-09-04|Tambrands, Inc.|Shaped tampon|JPS61184685A|1985-02-12|1986-08-18|Hitachi Ltd|Translation information adding system| JPS62163173A|1986-01-14|1987-07-18|Toshiba Corp|Mechanical translating device| JP2732563B2|1986-05-20|1998-03-30|株式会社東芝|機械翻訳方法及び装置| JPS638864A|1986-06-27|1988-01-14|Sharp Corp|Translating device|JPH03129469A|1989-10-14|1991-06-03|Canon Inc|Natural language processor| US5329446A|1990-01-19|1994-07-12|Sharp Kabushiki Kaisha|Translation machine| JP3293619B2|1990-08-20|2002-06-17|株式会社シーエスケイ|日本語構文解析システム| JPH04184677A|1990-11-20|1992-07-01|Csk Corp|Japanese language syntax analyzing system| JP3222173B2|1990-12-20|2001-10-22|株式会社シーエスケイ|日本語構文解析システム| US5416903A|1991-08-19|1995-05-16|International Business Machines Corporation|System and method for supporting multilingual translations of a windowed user interface| US5528491A|1992-08-31|1996-06-18|Language Engineering Corporation|Apparatus and method for automated natural language translation| US6278967B1|1992-08-31|2001-08-21|Logovista Corporation|Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis| US6760695B1|1992-08-31|2004-07-06|Logovista Corporation|Automated natural language processing| JPH06195373A|1992-12-24|1994-07-15|Sharp Corp|機械翻訳装置| JP2821840B2|1993-04-28|1998-11-05|日本アイ・ビー・エム株式会社|機械翻訳装置| JP2855409B2|1994-11-17|1999-02-10|日本アイ・ビー・エム株式会社|自然言語処理方法及びシステム| US6470306B1|1996-04-23|2002-10-22|Logovista Corporation|Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens| US6233544B1|1996-06-14|2001-05-15|At&T Corp|Method and apparatus for language translation| US6496844B1|1998-12-15|2002-12-17|International Business Machines Corporation|Method, system and computer program product for providing a user interface with alternative display language choices| US6460015B1|1998-12-15|2002-10-01|International Business Machines Corporation|Method, system and computer program product for automatic character transliteration in a text string object| US6389386B1|1998-12-15|2002-05-14|International Business Machines Corporation|Method, system and computer program product for sorting text strings| US7099876B1|1998-12-15|2006-08-29|International Business Machines Corporation|Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class| JP2001005675A|1999-06-21|2001-01-12|Matsushita Electric Ind Co Ltd|プログラム変換装置及びプロセッサ| JP3662519B2|2000-07-13|2005-06-22|シャープ株式会社|光ピックアップ| US7536293B2|2003-02-24|2009-05-19|Microsoft Corporation|Methods and systems for language translation| KR100911621B1|2007-12-18|2009-08-12|한국전자통신연구원|한영 자동번역 방법 및 장치| JP5295576B2|2008-01-24|2013-09-18|ヤフー株式会社|自然言語解析装置、自然言語解析方法および自然言語解析プログラム| WO2010105265A2|2009-03-13|2010-09-16|Jean-Pierre Makeyev|Text creation system and method| CN104298662B|2014-04-29|2017-10-10|中国专利信息中心|一种基于有机物命名实体的机器翻译方法及翻译系统| CN107229616A|2016-03-25|2017-10-03|阿里巴巴集团控股有限公司|语言识别方法、装置及系统| US10346547B2|2016-12-05|2019-07-09|Integral Search International Limited|Device for automatic computer translation of patent claims|
法律状态:
1990-06-28| AL| Designated countries for regional patents|Kind code of ref document: A1 Designated state(s): AT BE CH DE ES FR GB IT LU NL SE | 1990-08-13| WWE| Wipo information: entry into national phase|Ref document number: 1990900994 Country of ref document: EP | 1990-12-27| WWP| Wipo information: published in national office|Ref document number: 1990900994 Country of ref document: EP | 1997-01-14| WWW| Wipo information: withdrawn in national office|Ref document number: 1990900994 Country of ref document: EP |
优先权:
[返回顶部]
申请号 | 申请日 | 专利标题 相关专利
Sulfonates, polymers, resist compositions and patterning process
Washing machine
Washing machine
Device for fixture finishing and tension adjusting of membrane
Structure for Equipping Band in a Plane Cathode Ray Tube
Process for preparation of 7 alpha-carboxyl 9, 11-epoxy steroids and intermediates useful therein an
国家/地区
|